Presto with AWS S3

Database Tutorials - অ্যাপাচি প্রেস্টো (Apache Presto)

247

Presto হল একটি ডিস্ট্রিবিউটেড SQL কোয়েরি ইঞ্জিন যা বিভিন্ন ডেটা সোর্সের সাথে সংযুক্ত হতে সক্ষম। এর মধ্যে AWS S3 (Amazon Simple Storage Service) একটি জনপ্রিয় স্টোরেজ সিস্টেম হিসেবে ব্যবহৃত হয়। Presto S3 ব্যবহার করে আপনি ক্লাউডে সংরক্ষিত ডেটা দ্রুত এবং দক্ষভাবে বিশ্লেষণ করতে পারেন।

Presto তে AWS S3 ব্যবহার করার জন্য, আপনাকে Hive Connector এর মাধ্যমে S3-তে সংরক্ষিত ডেটার উপর কোয়েরি চালাতে হবে। S3 এবং Presto এর সংযোগ স্থাপনের জন্য কিছু কনফিগারেশন এবং সেটআপ করতে হবে।

Presto with AWS S3 Integration Overview

Presto AWS S3 তে সংরক্ষিত ডেটা বিশ্লেষণের জন্য Hive Connector ব্যবহার করে। Hive Connector Presto কে S3 তে ডেটা পড়তে এবং লিখতে সহায়তা করে। Presto এর মাধ্যমে আপনি S3 এ সংরক্ষিত বিভিন্ন ফাইল যেমন Parquet, ORC, JSON, CSV ইত্যাদি ফাইল ফরম্যাটে সংরক্ষিত ডেটা বিশ্লেষণ করতে পারবেন।

১. S3 সংযোগের জন্য Presto কনফিগারেশন

প্রথমে Presto এর Hive Connector ব্যবহার করে S3 এর সাথে সংযোগ স্থাপন করতে হবে। এই সংযোগ কনফিগার করতে hive.properties ফাইল তৈরি করা হয় যা etc/catalog/ ফোল্ডারে রাখা হয়।

hive.properties কনফিগারেশন:

Presto এর etc/catalog/ ডিরেক্টরিতে একটি hive.properties ফাইল তৈরি করুন এবং নিচের কনফিগারেশনটি যোগ করুন:

connector.name=hive-hadoop2
hive.metastore.uri=thrift://<metastore-uri>:9083
hive.s3.endpoint=s3.amazonaws.com
hive.s3.aws-access-key-id=<your-aws-access-key>
hive.s3.aws-secret-access-key=<your-aws-secret-key>
hive.s3.ssl-enabled=true
hive.s3.bucket-name=<your-bucket-name>
hive.s3.path-style-access=false

কনফিগারেশন ফাইলের ব্যাখ্যা:

connector.name: Hive connector ব্যবহার করা হচ্ছে, তাই এর মান hive-hadoop2।
hive.metastore.uri: Hive মেটাস্টোরের URI যেখানে আপনি Hive এর মেটাডেটা সংরক্ষণ করছেন।
hive.s3.endpoint: S3 এর এন্ডপয়েন্ট URL।
hive.s3.aws-access-key-id: আপনার AWS অ্যাকাউন্টের Access Key।
hive.s3.aws-secret-access-key: আপনার AWS অ্যাকাউন্টের Secret Key।
hive.s3.ssl-enabled: এটি S3 তে SSL ব্যবহার করার জন্য সেট করা হয়।
hive.s3.bucket-name: S3 তে যে বাকি ফাইলগুলি আপনি বিশ্লেষণ করতে চান তার Bucket Name।
hive.s3.path-style-access: S3 এর পাথ স্টাইল অ্যাক্সেস সক্রিয় করা।

২. S3 তে ডেটা পড়া এবং বিশ্লেষণ করা

Presto CLI বা Presto Web UI থেকে আপনি S3 তে সংরক্ষিত ডেটা বিশ্লেষণ করতে পারেন। S3 এ সংরক্ষিত ডেটা যেমন Parquet বা ORC ফাইল ফরম্যাটে থাকলে, Presto সেই ফরম্যাটের ডেটা রিড এবং প্রক্রিয়া করতে সক্ষম।

Presto CLI দিয়ে কোয়েরি চালানো:

java -jar presto-cli-350-executable.jar --server <presto-server-ip>:8080 --catalog hive --schema <your-schema>

এরপর, S3 তে সংরক্ষিত ডেটা বিশ্লেষণ করতে নিচের মত কোয়েরি চালানো যায়:

SELECT * FROM s3_table_name LIMIT 10;

এই কোয়েরি S3 তে সংরক্ষিত s3_table_name টেবিলের প্রথম ১০টি রেকর্ড বের করে আনবে।

৩. S3 তে পারকেট বা ORC ফাইল বিশ্লেষণ

S3 তে সংরক্ষিত Parquet বা ORC ফাইলের ডেটা বিশ্লেষণ করা Presto এর মাধ্যমে খুবই সহজ। Presto তে Hive Connector ব্যবহার করে আপনি Parquet বা ORC ফাইল ফরম্যাটে সংরক্ষিত ডেটার উপর কোয়েরি চালাতে পারবেন।

Parquet ফাইলের উপর কোয়েরি:

SELECT * FROM parquet('s3://your-bucket-name/path/to/parquet-file');

ORC ফাইলের উপর কোয়েরি:

SELECT * FROM orcfile('s3://your-bucket-name/path/to/orc-file');

৪. S3 Query Optimization

S3 তে ডেটা বিশ্লেষণ করতে গেলে কিছু অপটিমাইজেশন পদ্ধতি ব্যবহার করলে কোয়েরি পারফরম্যান্স বাড়ানো সম্ভব:

১. Partitioning

S3 তে ডেটা পার্টিশন করে রাখলে কোয়েরি দ্রুততর হবে। Presto Hive Connector পার্টিশনিং সাপোর্ট করে, তাই আপনি টেবিলের ডেটা পার্টিশন করে কাজ করতে পারেন।

CREATE TABLE partitioned_table (
    column1 INT,
    column2 VARCHAR
)
WITH (
    format = 'PARQUET',
    partitioned_by = ARRAY['column1']
);

২. File Format Optimization

Presto পারফরম্যান্স বৃদ্ধির জন্য সঠিক ফাইল ফরম্যাট ব্যবহার করা উচিত। Parquet এবং ORC ফাইল ফরম্যাটs সাধারণত ডেটা বিশ্লেষণের জন্য অনেক বেশি কার্যকরী এবং কম জায়গা নেয়।

৩. Column Pruning

Presto শুধুমাত্র প্রয়োজনীয় কলামগুলি লোড করে কাজ করে, যা ডেটা প্রসেসিং দ্রুততর করে।

৫. S3 তে Presto Data Insert এবং Export

Presto S3 তে ডেটা ইনসার্ট বা এক্সপোর্ট করতে পারে। আপনাকে INSERT INTO বা CTAS (Create Table As Select) কৌশল ব্যবহার করতে হবে।

CTAS (Create Table As Select) Example:

CREATE TABLE s3_table
WITH (format = 'PARQUET')
AS SELECT * FROM local_table;

এই কোয়েরিটি local_table থেকে ডেটা নিয়ে S3 তে নতুন s3_table তৈরি করবে।

৬. সারাংশ

Presto S3 এর সাথে সংযোগ করে একটি শক্তিশালী ডেটা বিশ্লেষণ টুল হিসেবে কাজ করতে পারে। Hive Connector ব্যবহার করে আপনি সহজে S3 তে সংরক্ষিত ডেটা পড়তে এবং বিশ্লেষণ করতে পারবেন। S3 তে ডেটা পার্টিশনিং, ফাইল ফরম্যাট অপটিমাইজেশন, এবং কিউরির পারফরম্যান্স উন্নত করার জন্য বিভিন্ন পদ্ধতি ব্যবহার করা যেতে পারে। Presto এর মাধ্যমে S3 এর বিশাল ডেটাসেট দ্রুত বিশ্লেষণ করা সম্ভব, যা ক্লাউডে ডেটা সঞ্চয় এবং বিশ্লেষণের জন্য একটি আদর্শ সমাধান।

Content added By

Md Azizur Rahman

S3 Data Source কনফিগার করা

191

Presto একটি শক্তিশালী ডিস্ট্রিবিউটেড SQL কোয়েরি ইঞ্জিন যা বিভিন্ন ডেটা সোর্সের সাথে কাজ করতে পারে। এর মধ্যে একটি জনপ্রিয় সোর্স হল Amazon S3 (Simple Storage Service), যা ক্লাউড ভিত্তিক ডেটা স্টোরেজ হিসাবে ব্যবহার করা হয়। Presto S3-এর সাথে সংযুক্ত হয়ে ডেটা বিশ্লেষণ করতে পারে। এই টিউটোরিয়ালে আমরা Presto S3 Data Source কনফিগারেশন প্রক্রিয়া বিস্তারিতভাবে দেখবো।

১. Presto S3 Connector কনফিগারেশন

Presto S3 ডেটা সোর্সে সংযোগ স্থাপন করতে Hive Connector ব্যবহার করা হয়। সুতরাং, আপনাকে Hive Connector কনফিগার করতে হবে যা Amazon S3-এর সাথে সংযুক্ত হবে।

ধাপ ১: Hive Connector কনফিগারেশন ফাইল তৈরি করা

Presto-তে S3 কনফিগার করতে etc/catalog/hive.properties ফাইলে সঠিক কনফিগারেশন করতে হবে। এটি Presto S3 সংযোগের জন্য নির্দেশিকা হিসেবে কাজ করবে। ফাইলটির মধ্যে নিম্নলিখিত কনফিগারেশন সেট করতে হবে:

hive.properties কনফিগারেশন ফাইল:

connector.name=hive-hadoop2
hive.metastore.uri=thrift://localhost:9083
hive.s3.endpoint=s3.amazonaws.com
hive.s3.aws-access-key-id=<AWS_ACCESS_KEY_ID>
hive.s3.aws-secret-access-key=<AWS_SECRET_ACCESS_KEY>
hive.s3.use-instance-credentials=true

কনফিগারেশন ফাইলের ব্যাখ্যা:

connector.name=hive-hadoop2: Presto Hive Connector ব্যবহার করছে। এটি সঠিক হাইভ কনফিগারেশন করতে সাহায্য করে।
hive.metastore.uri=thrift://localhost:9083: Hive Metastore URI যা সঠিকভাবে সন্নিবেশিত এবং Hive ডেটাবেসের সাথে সংযোগ করবে।
hive.s3.endpoint=s3.amazonaws.com: Amazon S3-এ সংযোগের জন্য ইন্ডপয়েন্ট নির্ধারণ।
hive.s3.aws-access-key-id=<AWS_ACCESS_KEY_ID>: S3 অ্যাক্সেসের জন্য আপনার AWS অ্যাক্সেস কী। এটি আপনার AWS অ্যাকাউন্ট থেকে পাওয়া যাবে।
hive.s3.aws-secret-access-key=<AWS_SECRET_ACCESS_KEY>: S3 অ্যাক্সেসের জন্য আপনার AWS সিক্রেট অ্যাক্সেস কী।
hive.s3.use-instance-credentials=true: যদি আপনি AWS EC2 ইন্সট্যান্স ব্যবহার করেন, তবে এটি EC2 ইনস্ট্যান্সের সুরক্ষিত তথ্য ব্যবহার করবে।

ধাপ ২: AWS Access Key এবং Secret Key সঠিকভাবে কনফিগার করা

আপনার AWS অ্যাকাউন্টে লগ ইন করুন এবং IAM (Identity and Access Management) থেকে একটি Access Key এবং Secret Key তৈরি করুন। এই কীগুলির মাধ্যমে Presto আপনার S3 ব্যাকএন্ডের সাথে সংযুক্ত হবে। সেগুলি উপরের কনফিগারেশন ফাইলে সঠিকভাবে প্রবেশ করান।

২. AWS CLI Configuration (Optional)

যদি আপনার সিস্টেমে AWS CLI ইনস্টল করা থাকে এবং আপনি AWS CLI credential ব্যবহার করতে চান, তাহলে আপনি নিম্নলিখিত কনফিগারেশন ফাইল ব্যবহার করতে পারেন:

aws configure

এটি আপনাকে আপনার AWS Access Key ID এবং AWS Secret Access Key প্রবেশ করতে বলবে। CLI কনফিগারেশন ফাইলটি স্বয়ংক্রিয়ভাবে /home/<user>/.aws/credentials ফাইলে সংরক্ষণ করবে। Presto S3 এর জন্য এই তথ্য ব্যবহার করবে।

৩. Presto S3 Connector এবং Hive Query Execution

S3 ডেটা সোর্স কনফিগার করার পরে, Presto সন্নিবেশিত S3 ডেটার উপর SQL কোয়েরি চালাতে সক্ষম হবে। একবার সঠিক কনফিগারেশন সম্পন্ন হলে, Presto আপনার S3-এ সংরক্ষিত ডেটাকে কোয়েরি করতে সক্ষম হবে।

ধাপ ১: Presto CLI বা Web UI ব্যবহার করে কোয়েরি চালানো

এখন আপনি Presto CLI বা Web UI ব্যবহার করে S3 ডেটাসোর্সে কোয়েরি চালাতে পারবেন। উদাহরণ:

Presto CLI এ কোয়েরি চালানো:

java -jar presto-cli-350-executable.jar --server <presto-server-ip>:8080 --catalog hive --schema default

তারপর আপনি S3 তে সংরক্ষিত ডেটাতে কোয়েরি চালাতে পারবেন:

SELECT * FROM s3_table LIMIT 10;

এটি আপনার S3 bucket এর s3_table টেবিল থেকে প্রথম ১০টি রেকর্ড তুলে আনবে।

৪. Presto S3 Connector এর উন্নত কনফিগারেশন

আপনার S3 ডেটা সোর্সের জন্য কিছু অতিরিক্ত কনফিগারেশন অপশন রয়েছে যা আপনি Performance এবং Security এর জন্য কাস্টমাইজ করতে পারেন।

৪.১. S3 Storage Class নির্বাচন

S3-এর বিভিন্ন স্টোরেজ ক্লাস রয়েছে যেমন STANDARD, IA (Infrequent Access), এবং ONEZONE_IA। আপনি যদি স্টোরেজ ক্লাস কাস্টমাইজ করতে চান, তাহলে Presto-র hive.s3.storage-class প্যারামিটার ব্যবহার করতে পারেন।

hive.s3.storage-class=STANDARD_IA

৪.২. S3 Multipart Upload

S3-এর বড় ফাইলের জন্য Multipart Upload ব্যবহার করতে পারেন, যা বড় ফাইল দ্রুত আপলোড করার জন্য সহায়ক। Presto সিস্টেমের মাধ্যমে S3 multipart upload সমর্থিত।

hive.s3.multipart-upload-enabled=true

৫. S3 Data Query Optimization Techniques

Presto-তে S3 ডেটা সোর্সের উপর কোয়েরি অপটিমাইজ করার জন্য কিছু টিপস:

Partitioning:
S3 ডেটা সোর্সে পাটিশনিং ব্যবহার করে ডেটা দ্রুত পাওয়া যায়। S3 bucket তে পাটিশন তৈরি করুন এবং Presto তা ব্যবহার করে কোয়েরি অপটিমাইজ করবে।
File Formats:
Presto S3 এর জন্য Parquet এবং ORC ফাইল ফরম্যাট ব্যবহার করতে পারে, যা কোয়েরি এক্সিকিউশনে উচ্চ পারফরম্যান্স নিশ্চিত করে। এই ফরম্যাটগুলি কলাম-বেসড স্টোরেজের জন্য উপযুক্ত।
Predicate Pushdown:
Presto বিভিন্ন ফিল্টারিং অপারেশন, যেমন WHERE ক্লজ, S3-এ ডেটা পড়ার আগে প্রয়োগ করতে পারে, যা ডেটা প্রক্রিয়াকরণ দ্রুত করে।

সারাংশ

Presto-তে S3 ডেটা সোর্স কনফিগার করা একটি সহজ প্রক্রিয়া, যেখানে Hive Connector ব্যবহার করে S3-এর সাথে সংযোগ স্থাপন করা হয়। S3 এ সংরক্ষিত ডেটা কুয়েরি করার জন্য আপনাকে সঠিক কনফিগারেশন ফাইল সেট করতে হবে, যা Presto-কে আপনার ডেটা সোর্সে সংযুক্ত করতে সাহায্য করবে। একবার কনফিগারেশন হয়ে গেলে, Presto S3-এর উপর দ্রুত SQL কোয়েরি চালাতে সক্ষম হবে, এবং আপনিও সহজেই বিশ্লেষণ করতে পারবেন।

Content added By

Md Azizur Rahman

Presto দিয়ে S3 Data Query করা

191

Presto একটি অত্যন্ত শক্তিশালী ডিস্ট্রিবিউটেড SQL কোয়েরি ইঞ্জিন যা বিভিন্ন ডেটা সোর্সের সাথে কাজ করতে পারে। একটি গুরুত্বপূর্ণ ডেটা সোর্স হলো Amazon S3, যা একটি স্কেলেবল এবং সুরক্ষিত ক্লাউড স্টোরেজ সার্ভিস। Presto S3 এর সাথে কাজ করতে পারে এবং S3 থেকে ডেটা পড়ে SQL কোয়েরি চালাতে সহায়ক।

প্রথমে আপনাকে Presto-কে S3 ডেটা সোর্সের সাথে সংযুক্ত করতে হবে এবং তারপর S3-এ সংরক্ষিত ডেটার উপর SQL কোয়েরি চালাতে হবে।

১. Presto তে S3 Connector কনফিগারেশন

Presto এর সাথে S3 সংযোগ করার জন্য Hive Connector ব্যবহার করতে হয়। Presto Hive Connector-এ S3 এর জন্য কিছু কনফিগারেশন সেটিংস রয়েছে যা S3 এ সংরক্ষিত ডেটা অ্যাক্সেস করতে সহায়ক।

ধাপ ১: S3 Connector কনফিগারেশন ফাইল তৈরি করা

Presto-তে S3 এর সাথে সংযোগ স্থাপনের জন্য, hive.properties কনফিগারেশন ফাইল তৈরি করতে হবে যা Presto ক্লাস্টারের etc/catalog/ ফোল্ডারে থাকবে।

hive.properties উদাহরণ:

connector.name=hive-hadoop2
hive.s3.endpoint=s3.amazonaws.com
hive.s3.aws-access-key-id=<AWS_ACCESS_KEY_ID>
hive.s3.aws-secret-access-key=<AWS_SECRET_ACCESS_KEY>
hive.metastore.uri=thrift://<hive-metastore-uri>

connector.name=hive-hadoop2: এটি Hive Hadoop 2 Connector ব্যবহার করবে, যা S3 এর সাথে কাজ করার জন্য উপযুক্ত।
hive.s3.endpoint=s3.amazonaws.com: এটি S3-এর endpoint।
hive.s3.aws-access-key-id এবং hive.s3.aws-secret-access-key: S3 অ্যাক্সেস করার জন্য AWS অ্যাক্সেস কীগুলি।
hive.metastore.uri: Hive মেটাস্টোর URI, এটি আপনার Hive সিস্টেমের জন্য কনফিগার করা থাকতে হবে। সাধারণত এটি thrift://localhost:9083 হবে, তবে আপনি আপনার মেটাস্টোর কনফিগারেশন অনুযায়ী এটি সেট করতে হবে।

ধাপ ২: AWS Credentials Setup

Presto-তে S3 অ্যাক্সেস করার জন্য আপনার AWS অ্যাক্সেস কীগুলি সঠিকভাবে কনফিগার করা থাকতে হবে। আপনি ~/.aws/credentials ফাইলে AWS অ্যাক্সেস কীগুলি রাখতে পারেন।

AWS Credentials File (~/.aws/credentials) উদাহরণ:

[default]
aws_access_key_id = <AWS_ACCESS_KEY_ID>
aws_secret_access_key = <AWS_SECRET_ACCESS_KEY>

এটি Presto-কে AWS S3 অ্যাক্সেস করতে সহায়ক হবে।

২. Presto CLI থেকে S3 ডেটা Query করা

Presto সঠিকভাবে কনফিগার করা হলে, আপনি Presto CLI বা SQL কোয়েরি ইঞ্জিন ব্যবহার করে S3 থেকে ডেটা পড়তে পারবেন। Presto CLI দিয়ে S3 ডেটা Query করার জন্য প্রথমে আপনাকে Presto CLI-এ লগইন করতে হবে এবং সঠিক ক্যাটালগ এবং স্কিমা নির্বাচন করতে হবে।

Presto CLI দিয়ে S3 ডেটা Query Example:

java -jar presto-cli-350-executable.jar --server <presto-server-ip>:8080 --catalog hive --schema default

এখানে:

hive হল ক্যাটালগ নাম (যেহেতু আমরা Hive Connector ব্যবহার করছি)।
default হল স্কিমা নাম।

Query Example:

S3-এ একটি টেবিল (যেমন CSV বা Parquet ফাইল) থাকতে পারে, যা Query করা যাবে। উদাহরণস্বরূপ:

SELECT * FROM s3_table LIMIT 10;

এটি s3_table নামে একটি টেবিলের প্রথম ১০টি রেকর্ড প্রদর্শন করবে যা S3 এ সংরক্ষিত।

Querying Parquet Files in S3:

SELECT * FROM parquet.'s3://your-bucket-name/path/to/your-file.parquet' LIMIT 10;

এটি S3-এর নির্দিষ্ট পথ থেকে Parquet ফাইলটি পড়ে এবং প্রথম ১০টি রেকর্ড প্রদর্শন করবে।

৩. Query Optimization for S3 Data

S3 থেকে ডেটা পড়ার সময় কিছু অপ্টিমাইজেশন কৌশল অনুসরণ করা যেতে পারে:

Partitioning: S3-এ ডেটা পার্টিশন করার মাধ্যমে কোয়েরি পারফরম্যান্স উন্নত করা যায়। প্রতিটি পার্টিশনের জন্য আলাদা আলাদা কোয়েরি চালানো সহজ এবং দ্রুত হয়।
Example:
```
SELECT * FROM s3_table WHERE year = 2022 AND month = 01;
```
Predicate Pushdown: Presto S3 থেকে ডেটা পড়ার সময় কেবলমাত্র প্রয়োজনীয় ডেটাই ফেরত আনবে, অর্থাৎ predicate pushdown প্রযুক্তি ব্যবহার করবে। এই প্রযুক্তি ব্যবহার করে S3 থেকে প্রয়োজনীয় রেকর্ডগুলোই কেবল লোড করা হয়, যা কোয়েরির পারফরম্যান্স উন্নত করে।
File Formats: S3-এ ডেটা সংরক্ষণের জন্য পারফরম্যান্স বাড়ানোর জন্য ফাইল ফরম্যাট নির্বাচন করা গুরুত্বপূর্ণ। Parquet বা ORC ফাইল ফরম্যাটগুলি CSV বা JSON এর তুলনায় অনেক দ্রুত এবং কার্যকর।

৪. Presto দিয়ে S3 Data Query এর সুবিধা

Scalability: Presto সিস্টেমটি একাধিক Worker Node ব্যবহার করে ডেটা প্রসেস করতে পারে, যা S3-এ থাকা বিশাল ডেটাসেটকে দ্রুত প্রসেস করতে সহায়ক।
Integration: S3 এর সাথে Presto-র ইন্টিগ্রেশন সহজ এবং স্কেলেবল, যা ব্যবহারকারীদের বৃহৎ পরিমাণে ডেটা প্রসেস করতে সাহায্য করে।
Cost Optimization: S3 থেকে ডেটা পড়ার সময়, Presto কেবলমাত্র প্রয়োজনীয় ডেটা লোড করে, যার ফলে খরচ কম হয়।

সারাংশ

Presto দিয়ে S3 ডেটা Query করা একটি কার্যকরী এবং স্কেলেবল পদ্ধতি। Presto S3 Connector ব্যবহার করে আপনি সহজেই S3-এ সংরক্ষিত ডেটা সংযুক্ত করতে এবং SQL কোয়েরির মাধ্যমে বিশ্লেষণ করতে পারেন। S3 ডেটার উপর পারফরম্যান্স অপটিমাইজেশন কৌশলগুলি অনুসরণ করে দ্রুত এবং কার্যকরী ডেটা প্রসেসিং করা যায়।

Content added By

Md Azizur Rahman

S3 এবং HDFS এর মধ্যে পার্থক্য

168

S3 (Amazon Simple Storage Service) এবং HDFS (Hadoop Distributed File System) উভয়ই ডিস্ট্রিবিউটেড ফাইল স্টোরেজ সিস্টেম, তবে তাদের ডিজাইন, কার্যকারিতা এবং ব্যবহারের ক্ষেত্রে কয়েকটি মৌলিক পার্থক্য রয়েছে। নিচে S3 এবং HDFS-এর মধ্যে পার্থক্যগুলি তুলে ধরা হলো:

১. স্থাপনা এবং ব্যবস্থাপনা (Setup and Management)

S3:
- Managed Service: S3 একটি Managed Cloud Storage সেবা, যা Amazon Web Services (AWS) দ্বারা পরিচালিত হয়। এটি ব্যবহারের জন্য কোনো সিস্টেম অ্যাডমিনিস্ট্রেটর বা ইনফ্রাস্ট্রাকচার সেটআপ করার প্রয়োজন হয় না।
- Scalability: এটি স্বয়ংক্রিয়ভাবে স্কেল করে এবং ব্যবহারকারীরা তাদের ডেটার জন্য কোনো সার্ভার বা নোড ব্যাবস্থা করতে হয় না।
HDFS:
- Self-managed: HDFS একটি Self-hosted Distributed File System, যেটি সাধারণত হ্যাডোপ ক্লাস্টারের মধ্যে স্থাপিত হয়। এটি পরিচালনা এবং রক্ষণাবেক্ষণের জন্য ইনফ্রাস্ট্রাকচার সেটআপ এবং সার্ভার বা নোড কনফিগারেশনের প্রয়োজন।
- Scalability: HDFS ক্লাস্টারে নতুন নোড যুক্ত করে স্কেল করা যায়, তবে এটি ব্যবস্থাপনা এবং কনফিগারেশনের জন্য অতিরিক্ত কাজের প্রয়োজন হতে পারে।

২. লভ্যতা এবং স্থায়িত্ব (Availability and Durability)

S3:
- High Availability and Durability: S3 99.999999999% (১১ নয়) ডিউরেবিলিটি অফার করে। এটি ডেটা কপি করে বিভিন্ন অঞ্চলে এবং ডেটা সেন্টারে সংরক্ষণ করে, তাই উচ্চ লভ্যতা এবং স্থায়িত্ব নিশ্চিত হয়।
- Global Availability: এটি বিশ্বের যে কোন জায়গা থেকে অ্যাক্সেস করা যায় এবং অ্যামাজনের ইকোসিস্টেমের অংশ হিসেবে গ্লোবালি সেবা পাওয়া যায়।
HDFS:
- High Availability: HDFS নিজস্ব ডিস্ট্রিবিউটেড নোডের মধ্যে ডেটা রিপ্লিকেট করে উচ্চ লভ্যতা নিশ্চিত করে। তবে, সিস্টেমের স্থায়িত্ব এবং লভ্যতা নির্ভর করে ব্যবহারকারীর কনফিগারেশনে।
- Local Availability: HDFS সাধারণত একটি নির্দিষ্ট ডেটা সেন্টারের মধ্যে সীমাবদ্ধ থাকে এবং বিশ্বের বিভিন্ন স্থানে তা অ্যাক্সেস করা সহজ নয়।

৩. দাম এবং খরচ (Cost and Pricing)

S3:
- Pay-as-you-go: S3-এ আপনি যে পরিমাণ ডেটা সংরক্ষণ করবেন তার জন্য আপনি মুলত পেমেন্ট করেন, এবং এই খরচ অ্যামাজনের প্রিপেইড স্টোরেজ প্ল্যানের ভিত্তিতে পরিবর্তিত হয়।
- Storage Classes: S3 বিভিন্ন স্টোরেজ ক্লাস অফার করে, যেমন Standard, Intelligent-Tiering, Glacier ইত্যাদি, যাতে আপনি খরচের পরিকল্পনা নির্ধারণ করতে পারেন।
HDFS:
- Hardware Cost: HDFS ব্যবহারের জন্য আপনাকে নিজের হ্যাডোপ ক্লাস্টার নির্মাণ করতে হবে, যার জন্য সার্ভার এবং স্টোরেজ হার্ডওয়্যার কেনার প্রয়োজন হতে পারে। এর ফলে প্রথমে উচ্চ খরচ আসতে পারে, তবে পরবর্তীতে ক্রমাগত খরচ কম থাকে।
- No Pay-as-you-go model: HDFS এ কোন pay-per-use মডেল নেই, এবং এটি ইনফ্রাস্ট্রাকচার খরচের জন্য নির্ভরশীল।

৪. ব্যবহার এবং ইন্টিগ্রেশন (Use and Integration)

S3:
- Cloud-Native: S3 মূলত Cloud-based এবং এটি অ্যামাজন ওয়েব সার্ভিসের (AWS) একটি অংশ, যা বিভিন্ন অ্যাপ্লিকেশন এবং সার্ভিসের সাথে সহজে ইন্টিগ্রেট করা যায়।
- Third-party Integration: এটি অন্যান্য সেবার (যেমন Google Cloud Storage, Microsoft Azure Blob Storage) সাথে ইন্টিগ্রেট করার জন্য জনপ্রিয় এবং ক্লাউড ভিত্তিক সিস্টেমে কার্যকরী।
HDFS:
- Big Data Ecosystem: HDFS মূলত Hadoop-based পরিবেশে ব্যবহৃত হয় এবং সাধারণত বড় ডেটা বিশ্লেষণের জন্য হ্যাডোপ সিস্টেমের অংশ হিসাবে ব্যবহৃত হয়।
- Integration with Big Data Tools: এটি হ্যাডোপ ইকোসিস্টেমের বিভিন্ন টুলস যেমন Hive, Pig, HBase, Spark ইত্যাদির সাথে কাজ করতে সক্ষম।

৫. ডেটা অ্যাক্সেস এবং রিড/রাইট অপারেশন (Data Access and Read/Write Operations)

S3:
- Object Storage: S3 হল একটি Object-based Storage সিস্টেম, যা ডেটা স্টোর করার জন্য বকেট (bucket) এবং অবজেক্ট (object) ব্যবহার করে। এটি RESTful API ব্যবহার করে অ্যাক্সেস করা যায় এবং খুব সহজে ইন্টিগ্রেট করা যায়।
- Eventual Consistency: S3-তে সাধারণত eventual consistency ব্যবহার করা হয়, যার মানে হল যে একটি অবজেক্ট আপডেট করার পর কিছু সময় পর্যন্ত সেটা নতুন করে দৃশ্যমান না হতে পারে।
HDFS:
- File-based Storage: HDFS একটি file-based storage সিস্টেম, যেখানে ডেটা ব্লক আকারে সংরক্ষিত হয় এবং ফাইল সিস্টেমের মাধ্যমে অ্যাক্সেস করা হয়।
- Strong Consistency: HDFS তে ডেটা strong consistency নিশ্চিত করে, অর্থাৎ একটি ফাইল আপডেট হলে, তা দ্রুত সবার কাছে দৃশ্যমান হয়ে যায়।

৬. নিরাপত্তা (Security)

S3:
- Built-in Security Features: S3 নিরাপত্তার জন্য বিভিন্ন ফিচার অফার করে যেমন Encryption (Data in Transit এবং Data at Rest), IAM (Identity and Access Management), Bucket Policies এবং Access Control Lists (ACLs)।
HDFS:
- Kerberos Authentication: HDFS তে Kerberos authentication ব্যবহার করা হয়, যা হ্যাডোপ ক্লাস্টারে সুরক্ষা নিশ্চিত করে।
- Access Control: HDFS তে ফাইল এবং ডিরেক্টরি স্তরে Access Control Lists (ACLs) ব্যবহার করা হয়।

৭. পারফরম্যান্স এবং স্কেলিং (Performance and Scaling)

S3:
- Performance: S3-এ পারফরম্যান্স সাধারণত ক্লাউডের উপর নির্ভরশীল, তবে এটি অনেক সিস্টেমের জন্য উচ্চ পারফরম্যান্স দিতে পারে। তবে হাই-থ্রুপুট ডেটা ট্রান্সফার এবং কমপ্লেক্স কোয়েরি প্রক্রিয়াগুলির জন্য অতিরিক্ত কনফিগারেশন বা অপটিমাইজেশন প্রয়োজন হতে পারে।
- Scalability: S3 স্বয়ংক্রিয়ভাবে স্কেল হয় এবং এটি যেকোনো আকারের ডেটা সঞ্চয় করতে সক্ষম।
HDFS:
- Performance: HDFS খুব ভালো পারফরম্যান্স প্রদান করে, বিশেষ করে বড় ডেটা সেটের জন্য, কারণ এটি ডিস্ট্রিবিউটেড সিস্টেমের মাধ্যমে ডেটা সংরক্ষণ করে এবং পারালাল প্রসেসিং সক্ষম করে।
- Scalability: HDFS ক্লাস্টারের সাথে স্কেল করা সহজ, তবে এটি হ্যাডোপ সিস্টেমের ইনফ্রাস্ট্রাকচার এবং ক্লাস্টার ম্যানেজমেন্টের উপর নির্ভরশীল।

সারাংশ

Feature	S3	HDFS
Type	Object Storage	File Storage
Deployment	Cloud-based (AWS)	Self-hosted (Hadoop Cluster)
Management	Fully managed	Self-managed
Scalability	Auto-scaling, virtually unlimited	Manual scaling, based on cluster size
Data Availability	High availability, redundant across regions	High availability, data replicated in cluster
Performance	Can be optimized but depends on cloud setup	Optimized for large-scale distributed data
Cost	Pay-as-you-go	Initial cost for hardware, then ongoing maintenance cost
Security	Built-in encryption, IAM, ACLs	Kerberos, ACLs
Use Case	Cloud-native storage for all types of data	Big data and analytics in Hadoop ecosystem

S3 একটি ক্লাউড-বেসড স্টোরেজ সিস্টেম যা সহজ ব্যবস্থাপনা এবং স্কেলিং অফার করে, যখন HDFS

একটি ডিস্ট্রিবিউটেড ফাইল সিস্টেম যা হ্যাডোপের অংশ হিসেবে ব্যবহার হয় এবং বড় ডেটাসেটের জন্য বেশি কার্যকরী।

Content added By

Md Azizur Rahman

S3 Query Optimization Techniques

191

Presto হল একটি ডিস্ট্রিবিউটেড SQL কোয়েরি ইঞ্জিন, যা বিভিন্ন ডেটা সোর্স থেকে ডেটা অ্যাক্সেস করতে সক্ষম। Amazon S3 হল একটি জনপ্রিয় ক্লাউড স্টোরেজ সিস্টেম যেখানে বৃহৎ আকারের ডেটা সংরক্ষিত থাকে। তবে, S3 থেকে ডেটা কুয়েরি করার সময় লেটেন্সি এবং ডেটা ট্রান্সফার খরচের কারণে পারফরম্যান্স সমস্যা হতে পারে। এসব সমস্যার সমাধান এবং কুয়েরি এক্সিকিউশনের সময় পারফরম্যান্স উন্নত করতে বিভিন্ন S3 Query Optimization Techniques ব্যবহার করা যেতে পারে।

নিচে কিছু কার্যকরী S3 Query Optimization Techniques দেওয়া হল, যা Presto দিয়ে S3 ডেটা কুয়েরি করার সময় পারফরম্যান্স বাড়াতে সাহায্য করবে।

১. S3-তে ডেটা পার্টিশনিং (Partitioning Data in S3)

পার্টিশনিং হল এমন একটি কৌশল, যেখানে ডেটা নির্দিষ্ট কলাম (যেমন date, region, product_type) এর উপর ভিত্তি করে ছোট ছোট ভাগে বিভক্ত করা হয়। এর ফলে, Presto কেবলমাত্র প্রয়োজনীয় পার্টিশনগুলো পড়বে এবং বাকী অংশগুলোকে এড়িয়ে যাবে, যার ফলে ডেটা রিডিং সময় কমে যাবে।

পার্টিশনিং কিভাবে কাজ করে:

Hive Partitioning: Presto-এর Hive Connector দিয়ে সহজেই পার্টিশন করা যায়।
ফোল্ডার স্ট্রাকচার: S3 তে ডেটা পার্টিশন করতে হায়ারারকিক্যাল ফোল্ডার স্ট্রাকচার ব্যবহার করুন, যেমন:
```
s3://my-bucket/data/year=2023/month=01/day=01/
s3://my-bucket/data/year=2023/month=01/day=02/
```

পার্টিশনিংয়ের সুবিধা:

Presto কেবলমাত্র সেই পার্টিশনগুলো পড়বে যা প্রয়োজন, ফলে I/O কম হয়।
S3 থেকে ডেটা আনার খরচ কমে যায়, কারণ শুধুমাত্র প্রয়োজনীয় ডেটা এক্সেস করা হয়।

২. কলামার ফাইল ফরম্যাট (Columnar File Formats - Parquet/ORC)

S3 তে ডেটা সাধারণত অবজেক্ট ফরম্যাটে স্টোর করা হয়, যা বিশ্লেষণাত্মক কাজের জন্য উপযুক্ত নয়। তবে কলামার ফাইল ফরম্যাট (যেমন Parquet অথবা ORC) ব্যবহারের মাধ্যমে পারফরম্যান্স উল্লেখযোগ্যভাবে বৃদ্ধি পায়, বিশেষত যেহেতু এই ফরম্যাটগুলো শুধুমাত্র প্রয়োজনীয় কলামগুলো পড়তে দেয়, ফলে I/O এবং মেমরি ব্যবহার কমে।

কলামার ফরম্যাট কিভাবে ব্যবহার করবেন:

ডেটাকে Parquet অথবা ORC ফরম্যাটে রূপান্তর করুন এবং S3 তে স্টোর করুন।
Presto-কে এই ফরম্যাটগুলো পড়তে কনফিগার করুন।

কলামার ফরম্যাটের সুবিধা:

শুধুমাত্র প্রয়োজনীয় কলামগুলো পড়া হয়, ফলে I/O অপারেশন কমে।
সাশ্রয়ী কম্প্রেশন, যা ডেটা দ্রুত অ্যাক্সেস করতে সহায়ক।
বড় ডেটাসেটে কোয়েরি এক্সিকিউশনের সময় দ্রুত ফলাফল আসে।

৩. Predicate Pushdown ব্যবহার করা (Using Predicate Pushdown)

Predicate Pushdown হল একটি কৌশল যেখানে WHERE ক্লজ বা ফিল্টার কন্ডিশন স্লো কোয়েরি এক্সিকিউশনের আগে S3 এর ডেটা সোর্সে পাঠানো হয়, যাতে শুধুমাত্র প্রয়োজনীয় ডেটা Presto দ্বারা প্রক্রিয়া করা হয়।

Predicate Pushdown কিভাবে কাজ করে:

Presto যখন কোয়েরি চালায়, তখন WHERE ক্লজ (যেমন WHERE date = '2023-01-01') S3 ডেটা সোর্সে পাঠায়। এতে করে S3 শুধুমাত্র সেই ডেটা সরবরাহ করবে যা ফিল্টার কন্ডিশন অনুযায়ী প্রয়োজন, ফলে ডেটা রিডিং সময় কমে যাবে।

Predicate Pushdown এর সুবিধা:

সঠিক ফিল্টারিংয়ের কারণে শুধুমাত্র প্রয়োজনীয় ডেটা রিড হয়।
I/O অপারেশন কমে, ফলে ডেটা ট্রান্সফারের খরচও কমে।

৪. Parallel Query Execution

Presto ডিস্ট্রিবিউটেড আর্কিটেকচার ব্যবহার করে একাধিক Worker Node এর মাধ্যমে কোয়েরি এক্সিকিউট করে। এতে S3 থেকে ডেটা দ্রুত অ্যাক্সেস করা সম্ভব হয়, কারণ একাধিক নোড একসাথে কাজ করে।

Parallel Query Execution কিভাবে কাজ করে:

Presto সিস্টেমে কোয়েরি একাধিক অংশে ভাগ হয়ে বিভিন্ন নোডে সমান্তরালভাবে কাজ করতে পারে।
আপনাকে task.max-worker-threads এবং query.max-workers সেটিংস কনফিগার করতে হবে, যাতে কর্মী নোডগুলি ডেটা সঠিকভাবে প্রক্রিয়া করতে পারে।

Parallel Execution এর সুবিধা:

S3 থেকে ডেটা দ্রুত পড়া যায়, কারণ Presto একাধিক নোডে কাজ ভাগ করে।
কোয়েরি এক্সিকিউশনের সময় দ্রুত কমপ্লিট হয়, বিশেষত বড় ডেটাসেটের ক্ষেত্রে।

৫. S3 Select ব্যবহার করা (Using S3 Select)

S3 Select হল একটি ফিচার যা আপনাকে S3 থেকে নির্দিষ্ট অংশের ডেটা অ্যাক্সেস করতে দেয়, এতে পুরো ফাইল না পড়ে শুধুমাত্র প্রয়োজনীয় অংশ পড়া হয়।

S3 Select কিভাবে ব্যবহার করবেন:

Presto স্বয়ংক্রিয়ভাবে S3 Select ব্যবহার করে যদি আপনার ফাইল CSV, JSON বা Parquet ফরম্যাটে থাকে।
Presto আপনার কোয়েরি অনুযায়ী S3 থেকে শুধু প্রাসঙ্গিক ডেটা নির্বাচন করবে।

S3 Select এর সুবিধা:

শুধুমাত্র প্রয়োজনীয় ডেটা পড়া হয়, ফলে I/O কমে এবং দ্রুত ফলাফল পাওয়া যায়।
S3 Select ব্যবহার করলে ডেটা ট্রান্সফার খরচ কমে যায়।

৬. ডেটার সাইজ অপটিমাইজেশন (Optimizing Data File Size)

S3 তে ডেটা ফাইল সাইজ খুব গুরুত্বপূর্ণ। যদি ফাইলগুলো খুব ছোট হয়, তবে অতিরিক্ত ওভারহেড হতে পারে। যদি ফাইলগুলো বড় হয়, তবে সেগুলি প্রক্রিয়া করার সময় মেমরি সমস্যা হতে পারে।

ফাইল সাইজ অপটিমাইজেশন কিভাবে করবেন:

ডেটার ফাইল সাইজ 128 MB থেকে 1 GB এর মধ্যে রাখুন।
ডেটা ফাইলগুলোকে কমপ্রেস করুন (যেমন GZIP, Snappy) যাতে ফাইল সাইজ কম হয় এবং দ্রুত পড়া যায়।

ফাইল সাইজ অপটিমাইজেশন এর সুবিধা:

S3 থেকে ডেটা দ্রুত এবং কার্যকরীভাবে পড়া যায়।
মেমরি ব্যবহারে ভারসাম্য থাকে, এবং প্রক্রিয়া করার সময় সিস্টেমে বেশি চাপ পড়ে না।

৭. Caching এবং Query Result Reuse

Presto কোয়েরি ফলাফল ক্যাশ করতে পারে, যাতে পূর্বে চালিত কোয়েরি আবার চালানোর প্রয়োজন না হয়। এর ফলে দ্রুত ফলাফল পাওয়া যায় এবং S3 থেকে ডেটা পুনরায় পড়ার প্রয়োজন হয় না।

Result Caching কিভাবে কাজ করে:

Presto-তে query.result-cache.enabled=true এই সেটিংটি চালু করলে, কোয়েরি ফলাফল ক্যাশে রাখা হবে এবং পরবর্তীতে দ্রুত পাওয়া যাবে।

Query Caching এর সুবিধা:

কোয়েরি পুনরায় চালানোর দরকার নেই, ফলে দ্রুত ফলাফল পাওয়া যায়।
S3 থেকে পুনরায় ডেটা পড়ার প্রয়োজন হয় না, সুতরাং I/O কমে যায়।

৮. S3 পারফরম্যান্স মেট্রিক্স মনিটরিং (Monitoring S3 Performance Metrics)

S3 পারফরম্যান্স মেট্রিক্স মনিটর করা গুরুত্বপূর্ণ, কারণ এটি পারফরম্যান্স বোতলনেকস সনাক্ত করতে সাহায্য করে।

S3 পারফরম্যান্স মনিটরিং কিভাবে করবেন:

AWS CloudWatch বা তৃতীয় পক্ষের মনিটরিং টুল ব্যবহার করে S3 এর পারফরম্যান্স ট্র্যাক করুন।
S3 সার্ভার-সাইড মেট্রিক্স এবং GetObject latency, request rate, error rates, throughput পর্যবেক্ষণ করুন।

Monitoring এর সুবিধা:

পারফরম্যান্স সঠিকভাবে পর্যবেক্ষণ করা যায় এবং উন্নত করার জন্য প্রয়োজনীয় পদক্ষেপ নেওয়া যায়।
S3 এর পারফরম্যান্স বটলনেক সমাধান করা যায়।

**উপসং

হার**

Presto-তে S3 Query Optimization Techniques ব্যবহার করে, আপনি S3 থেকে ডেটা দ্রুত এবং কার্যকরীভাবে প্রসেস করতে পারবেন। Data Partitioning, Columnar File Formats, Predicate Pushdown, Parallel Query Execution, S3 Select, Caching, এবং File Size Optimization এসব কৌশল S3 থেকে ডেটা অ্যাক্সেস করার সময় পারফরম্যান্স উল্লেখযোগ্যভাবে উন্নত করতে সহায়ক।

Content added By

Md Azizur Rahman

Apache Presto পরিচিতি Presto ইনস্টলেশন এবং কনফিগারেশন Presto এর মৌলিক ধারণা Presto CLI এবং Basic Query Execution Presto Connectors

Presto with AWS S3

Presto with AWS S3 Integration Overview

১. S3 সংযোগের জন্য Presto কনফিগারেশন

hive.properties কনফিগারেশন:

কনফিগারেশন ফাইলের ব্যাখ্যা:

২. S3 তে ডেটা পড়া এবং বিশ্লেষণ করা

Presto CLI দিয়ে কোয়েরি চালানো:

৩. S3 তে পারকেট বা ORC ফাইল বিশ্লেষণ

Parquet ফাইলের উপর কোয়েরি:

ORC ফাইলের উপর কোয়েরি:

৪. S3 Query Optimization

১. Partitioning

২. File Format Optimization

৩. Column Pruning

৫. S3 তে Presto Data Insert এবং Export

CTAS (Create Table As Select) Example:

৬. সারাংশ

S3 Data Source কনফিগার করা

১. Presto S3 Connector কনফিগারেশন

ধাপ ১: Hive Connector কনফিগারেশন ফাইল তৈরি করা

কনফিগারেশন ফাইলের ব্যাখ্যা:

ধাপ ২: AWS Access Key এবং Secret Key সঠিকভাবে কনফিগার করা

২. AWS CLI Configuration (Optional)

৩. Presto S3 Connector এবং Hive Query Execution

ধাপ ১: Presto CLI বা Web UI ব্যবহার করে কোয়েরি চালানো

৪. Presto S3 Connector এর উন্নত কনফিগারেশন

৪.১. S3 Storage Class নির্বাচন

৪.২. S3 Multipart Upload

৫. S3 Data Query Optimization Techniques

সারাংশ

Presto দিয়ে S3 Data Query করা

১. Presto তে S3 Connector কনফিগারেশন

ধাপ ১: S3 Connector কনফিগারেশন ফাইল তৈরি করা

২. Presto CLI থেকে S3 ডেটা Query করা

Presto CLI দিয়ে S3 ডেটা Query Example:

Query Example:

Querying Parquet Files in S3:

৩. Query Optimization for S3 Data

৪. Presto দিয়ে S3 Data Query এর সুবিধা

সারাংশ

S3 এবং HDFS এর মধ্যে পার্থক্য

১. স্থাপনা এবং ব্যবস্থাপনা (Setup and Management)

২. লভ্যতা এবং স্থায়িত্ব (Availability and Durability)

৩. দাম এবং খরচ (Cost and Pricing)

৪. ব্যবহার এবং ইন্টিগ্রেশন (Use and Integration)

৫. ডেটা অ্যাক্সেস এবং রিড/রাইট অপারেশন (Data Access and Read/Write Operations)

৬. নিরাপত্তা (Security)

৭. পারফরম্যান্স এবং স্কেলিং (Performance and Scaling)

সারাংশ

S3 Query Optimization Techniques

১. S3-তে ডেটা পার্টিশনিং (Partitioning Data in S3)

পার্টিশনিং কিভাবে কাজ করে:

পার্টিশনিংয়ের সুবিধা:

২. কলামার ফাইল ফরম্যাট (Columnar File Formats - Parquet/ORC)

কলামার ফরম্যাট কিভাবে ব্যবহার করবেন:

কলামার ফরম্যাটের সুবিধা:

৩. Predicate Pushdown ব্যবহার করা (Using Predicate Pushdown)

Predicate Pushdown কিভাবে কাজ করে:

Predicate Pushdown এর সুবিধা:

৪. Parallel Query Execution

Parallel Query Execution কিভাবে কাজ করে:

Parallel Execution এর সুবিধা:

৫. S3 Select ব্যবহার করা (Using S3 Select)

S3 Select কিভাবে ব্যবহার করবেন:

S3 Select এর সুবিধা:

৬. ডেটার সাইজ অপটিমাইজেশন (Optimizing Data File Size)

ফাইল সাইজ অপটিমাইজেশন কিভাবে করবেন:

ফাইল সাইজ অপটিমাইজেশন এর সুবিধা:

৭. Caching এবং Query Result Reuse

Result Caching কিভাবে কাজ করে:

Query Caching এর সুবিধা:

৮. S3 পারফরম্যান্স মেট্রিক্স মনিটরিং (Monitoring S3 Performance Metrics)

S3 পারফরম্যান্স মনিটরিং কিভাবে করবেন:

Monitoring এর সুবিধা:

**উপসং

স্যাট অ্যাকাডেমী অ্যাপ

All Notifications

Lorem ipsum dolor sit amet consectetur adipisicing elit. Eaque, officia!

Lorem ipsum dolor sit amet consectetur adipisicing elit. Eaque, officia!

Lorem ipsum dolor sit amet consectetur adipisicing elit. Eaque, officia!